智能论文笔记

New Datasets for Dynamic Malware Classification

Berkant Düzgün , Aykut Çayır , Ferhat Demirkıran , Ceyda Nur Kayha , Buket Gençaydın , Hasan Dağ

分类：人工智能 | 机器学习

2021-11-30

如今，恶意软件和恶意软件事件日常增加，即使具有各种防病毒系统和恶意软件检测或分类方法。已经提出了许多静态，动态和混合技术来检测恶意软件并将其分类为恶意软件系列。动态和混合恶意软件分类方法通过高效的静态恶意软件分类方法具有优势。由于难以在执行恶意软件行为的同时执行恶意软件行为，而不是在静态恶意软件分类中的基础代码，因此机器学习技术是安全专家检测恶意软件并动态确定其家庭的主要焦点。恶意软件的快速增长还带来了最近和更新的恶意软件数据集的必要性。我们在这项工作中介绍了两个新的更新数据集：一个有9,795个样本，从virussamples和virusshare的样品中编制了一个。本文还通过使用基于直方图的渐变升压，随机林，支持向量机和XGBoost模型与基于API呼叫的动态恶意软件分类进行分析了这两个数据集的平衡和不平衡版本的多级恶意软件分类性能。结果表明，支持向量机，在不平衡的virysample数据集中实现了94％的最高分，而相同的型号在平衡的virussample数据集中具有91％的精度。虽然xgboost是基于渐变的渐变促进的型号之一，但最高得分为90％和80％。在Virusshare数据集的两个版本中。本文还通过使用动态恶意软件分类文献中的四种最广泛的机器学习技术介绍了VirusShare和VirusSample Datasets的基线结果。我们认为这两个数据集和基线结果使得该领域的研究人员能够测试和验证其方法和方法。

translated by 谷歌翻译